Objetivos de Aprendizagem
- Compreender a hierarquia de threads CUDA (grids, blocos e threads)
- Diferenciar os tipos diferentes de memória da GPU (global, compartilhada, local, constante e textura)
- Aprender o ciclo de vida de um kernel CUDA do host para o dispositivo
- Implementar alocação e transferência básicas de memória usando cudaMalloc e cudaMemcpy